基于保守模型模型学习高采样效率多个估计值保守估计值

基于保守模型Actor-Critic的高采样效率强化学习算法

+v：mala2255获取更多论文基于保守模型Actor-Critic的王志海1，王杰1，2*，周琦1，李斌1，李厚强1，21中国科学技术大学GIPAS中科院技术重点实验室2合肥综合性国家科学中心人工智能研究院{zhwangx，zhouqida} @ mail....

【机器学习】集成模型/集成学习：多个模型相结合实现更好的预测

标签：机器学习集成学习人工智能

我们通过一个例子来理解集成学习的概念。假设你是一名电影导演，你依据一个非常重要且有趣的话题创作了一部短片。现在，你想在公开发布前获得影片的初步反馈（评级）。有哪些可行的方法呢？A：可以请一位朋友为电影...

大模型推理常见采样策略：Top-k, Top-p, Temperature, Beam Search

标签：自然语言处理人工智能大模型

大模型推理采样策略，举例通俗易懂汇总介绍

基于模型的强化学习笔记

标签：人工智能

基于模型的强化学习

机器学习(Machine Learning, ML)是人工智能领域的一个重要分支，也是一种基于数据构建的分析模型，旨在从...

标签：自然语言处理人工智能语言模型

作者：禅与计算机程序设计艺术 ...本系列博客文章主要面向技术人员，偏重于深度学习相关知识的分享，同时也提供一些经典的机器学习算法的理论基础，帮助读者更好的理解这些算法的工作原理和应用场景。

统计一致显著性估计在深度学习模型中的应用

标签：统计一致性估计罗顺燕乔治华盛顿大学亚马逊Alexa 深度学习解释技术

745统计一致显著性估计罗顺燕乔治华盛顿大学[email protected]亚马逊[email protected]方进乔治华盛顿大学[email protected]摘要深度学习越来越多地用于各种数据问题，这突出了正确理解和诊断这些模型的必要性，...

基于深度学习的单目3D人体姿态估计方法

标签：单目3D姿态估计基于深度学习的方法野外场景高精度联合训练

Germany{ihabibie，wxu，dmehta，gpons，theobalt}@ mpi-inf.mpg.org摘要基于卷积神经网络的单目3D人体姿态估计方法通常需要大量带有3D姿态注释的训练图像。虽然为具有人类的野外图像的大型语料

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的危险物品检测系统（深度学习模型+PySide6界面+训练数据集+Python代码）

标签： YOLOv8 YOLOv7/v6/v5 目标检测

本文介绍了一个基于深度学习的危险物品检测系统，采用最新YOLOv8算法，以及YOLOv7、YOLOv6、YOLOv5等算法，并对比不同版本性能。该系统能在多种媒介如图像、视频中准确识别危险物品（如斧头、大镰刀等），并深入讲解...

基于三种机器学习模型的岩爆类型预测及Python实现

标签：机器学习 python 人工智能

为了提高模型预测的可靠性与准确率，本文通过文献检索建立了397组岩爆工程案例样本，并选用最近邻、支持向量机、决策树这3种在岩爆类型分类性能上表现较好的机器学习算法作为预测模型进行训练，通过规范化的数据...

大模型学习

标签：学习大模型 llm

计算量和参数量的关系，近似认为，在一次前向传递中，对于每个token，每个模型参数，需要进行2次浮点数运算，即一次乘法法运算和一次加法运算。，b是batch，l是transformer层数，h指隐藏层维度，s是输入序列长度，n...

"深度学习安全性评估的不确定性估计和性能影响

标签：个文件的5个标签不确定性估计安全相关测试深度学习模型可靠性评估

版权归作者所有。深度学习的基准不确定性估计方法与安全相关的测试Maximilian Henne，Adrian Schwaiger，Karsten ...有一些方法试图通过设计模型来解决这个问题，以便为其不确定性提供更可靠的值。然而，即使这些模型

IGE-Net：基于深度学习的逆向图形能量网络用于人体姿态估计和单视图重建

标签：个文件的5个标签逆向图形能量网络人体姿态估计单视图重建深度学习

我们提议-使用基于深度学习的能量最小化框架来学习2D观测与所提出的世界模型之间的一致性度量，并证明该框架可以端到端训练以产生一致和现实的推断。我们评估了人体姿势估计和基于体素的对象重建基准的框架，并...

嵌套交叉验证：评估AI模型性能的技巧

标签：计算科学神经计算深度学习

嵌套交叉验证：评估AI模型性能的技巧 ...在机器学习和人工智能领域中,评估模型的性能是一个至关重要的步骤。准确评估模型在新数据上的泛化能力,可以帮助我们选择最佳模型,调整超参数,并避免过拟合。然而,传

数据科学技术之机器学习领域六大阶段最强学习路线(初步探索性数据分析EDA→数据预处理/广义的特征工程→...

标签：数据科学机器学习数据科学生命周期

DS/ML：数据科学技术之机器学习领域六大阶段最强学习路线(初步探索性数据分析EDA→数据预处理/广义的特征工程→模型训练/评估/推理→模型分析/反思/再优化→模型部署与监控→模型全流程优化)详解导读：数据科学...

【LLM】大模型幻觉问题的原因和缓解方法

标签：大模型自然语言处理幻觉问题

备注（下面提及的两个名词）： Faithfulness：是否遵循input content； Factualness：是否符合世界知识；传统nlp任务重，幻觉大多数是faithfulness，比如Intrinsic Hallucination（冲突），摘要内容和document内容...

【强化学习】个人总结05——不基于模型的控制

标签： python 人工智能算法

文章目录前言1. 行为价值函数的重要性2....而本章主要讲了在不基于模型的条件下如何通过 agent 的学习来优化价值函数，同时改善自身行为的策略以最大化收获的过程，这一过程也叫不基于模型的控制 (Model-free Co

机器学习模型可解释性的详尽介绍

机器之心平台来源：腾讯技术工程模型可解释性方面的研究，在近两年的科研会议上成为关注热点，因为大家不仅仅满足于模型的效果，更对模型效果的原因产生更多的思考，这样的思考有助于...

强化学习（2）--- 基于价值函数的强化学习算法

标签：算法深度学习

基于价值函数的强化学习算法

《百面机器学习》读书笔记（二）-模型估计

标签：机器学习百面机器学习模型评估

全部笔记的汇总贴：《百面机器学习》-读书笔记汇总一、评估指标的局限性二、ROC曲线三、余弦距离的应用四、A/B测试的陷阱五、模型评估的方法六、超参数调优七、过拟合与欠拟合

强化学习模型对比（强化学习3）

标签：人工智能

可以看到，正常的 Q-learning 是对于所有的 action 去最大的 Q，而这里是对于从生成模型 G 中采样得到若干个行动，然后再做扰动，由此得到的一系列 action 中找一个 Q 值最大的。这样，我们评估（s, a）时，我们就...

HM-GNN：基于分子-基序异构图神经网络的分子表示学习模型

标签：神经网络大数据算法

作者在该论文中考虑学习分子的基序级特征表示以改善分子整体的特征学习，基于此搭建了分子-基序异构图神经网络模型（HM-GNN），并在多个数据集上与其他模型比较取得了最优的表现，另外作者提出可以将此方法...

ICLR2023 | 基于几何结构预训练的蛋白质表示学习

标签：学习人工智能机器学习

通过多个基准任务的全面实验验证，文章中的模型在从头开始训练时效果优于以前的编码器，并且在使用更少的数据进行预训练的情况下实现堪比甚至超越最先进的基线方法的效果。需要注意的是，作者的模型是在不到100万个...

基于体采样的拓扑一致性多视点人脸推断

标签：多视图人脸建模拓扑一致性体采样面部网格预测高质量渲染

3824基于体采样的拓扑一致性多视点人脸推断Tianye Li1，2，Shichen Liu1，2，Timo Bolkart3，Jiayi Liu1，2，Hao Li1，2，and YajieZhao11USCInstituteforCreativ eTechnology，2USC，3MPIforIntelligentSystems，T...

AI－机器学习之模型评估

标签： AI 机器学习模型评估

在计算机科学特别是机器学习领域中，对模型的评估同样至关重要，只有选择与问题相匹配的评估方法，才能快速地发现模型选择或训练过程中出现的问题，迭代地对模型进行优化。模型评估主要分为离线评估和在线评估两个...

『大模型笔记』Ollama ModelFile(模型文件)

标签： LLM Ollama GPT

Ollama ModelFile(模型文件)

【机器学习】入门--模型评估与选择

标签：机器学习

测试数据更多地是指模型在实际使用中遇到的数据，为了和模型评估中使用的测试集进行区分，一般会把模型评估用的测试集叫做**验证集（validation set）**。对两个模型A和B，各使用k折交叉验证分别得到k个测试错误率，...

参数调优为什么要采样_模型评估和参数调优

标签：参数调优为什么要采样

模型评估和参数调优本博客根据百面机器学习，算法工程师带你去面试一书总结归纳，公式都是出自该书.本博客仅为个人总结学习，非商业用途，侵删.网址 http://www.ptpress.com.cn1. 准确率准确率是指分类正确的样本...

强化学习中基于政策激励的泛化能力和样本效率提高方法

标签：强化学习泛化能力环境变化采样效率实际应用

+v：mala2277获取更多论文适用的强化学习：利用政策激励提高泛化能力和样本效率杨正宇1人，任侃2人，罗旭芳2人，刘明焕1人，刘伟清2人，姜边2张伟南1李东升21上海交通大学2微软研究院{yzydestiny，minghuanliu，...

Nat. Commun. | DeepPROTACs: 基于深度学习的PROTACs降解药效预测模型

标签：深度学习人工智能 python

传统疗法依靠小分子抑制剂作为作用模式（MOA）实现占位驱动药理学。该方法存在无法处理不可成药的靶点、脱靶毒性、不良副作用、耐药性等缺点。单克隆抗体和RNA干扰（RNAi）方法开始补充小分子抑制剂方法，但仍存在...